بازشناسی عبارات ریاضی با استفاده از شبکه اتصالات مجازی کاراکترها جهت افزایش نرخ بازشناسی در متون چاپی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
- نویسنده زهرا حاجی حسنی
- استاد راهنما محمد رحمتی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1387
چکیده
بازشناسی عبارات ریاضی یکی از مسایل مهم در تبدیل اسناد علمی و مهندسی به قالب الکترونیکی می باشد و به عبارت دیگر هدف از تحقیقات در این زمینه، تبدیل تصویر یک عبارت ریاضی به معادل متنی آن می باشد. این مسأله به طور کلی شامل سه بخش اصلی می باشد: 1- استخراج عبارات ریاضی از اسناد 2- شناسایی نمادهای موجود در عبارت. 3- بررسی ساختاری عبارت و تبدیل به شکل متنی. در این پایان نامه به هر یک از مراحل فوق در بازشناسی عبارات ریاضی چاپی پرداخته شده است. به این ترتیب که ابتدا با دریافت تصویر یک سند چاپی شامل عبارات ریاضی و متن عادی، عبارات ریاضی از آن استخراج می شوند. در این پایان نامه استخراج عبارات ریاضی که جدا از متن اصلی هستند، مورد نظر است. در این مرحله، از روش استخراج بلوک ها و سپس بازشناسی نوع بلوک ها با استفاده از ویژگی های محلی و سراسری بلوک ها استفاده شده است. در مرحله ی بازشناسی نماد از یک روش ترکیبی مبتنی بر دسته بندی سلسله مراتبی و تطابق الگو استفاده شده است. در مرحله ی بازشناسی ساختار از یک روش جدید مبتنی بر گراف برای بازشناسی عبارات ریاضی تک خطی استفاده شده است. در این روش ابتدا نماد آغازین عبارت و سپس نمادهای تشکیل دهنده ی خط اصلی، در عبارت شناسایی می شوند. سپس با توجه به موقعیت های مکانی نمادها، شبکه ای تشکیل می گردد که، گراف اتصالات مجازی نمادها نامیده شده است. خروجی مرحله ی بازشناسی ساختار عبارت tex معادل عبارت ریاضی است که در قالب متن ارایه می شود. پس پردازش هایی نیز برای مقابله با خطاها و افزایش نرخ بازشناسی ارایه شده است. روش های فوق بر روی یک مجموعه ی شامل 86 صفحه از تصاویر اسناد که از مجلات ieee استخراج شدند مورد آزمایش قرار گرفتند. نرخ بازشناسی برای مرحله ی استخراج عبارات %90 حاصل گردید. از بین عبارات استخراج شده یک مجموعه ی 300تایی انتخاب شده و دو مرحله ی بازشناسی نماد و بازشناسی ساختار بر روی آنها مورد آزمایش قرار گرفت و نرخ بازشناسی، برای مرحله ی بازشناسی نمادها % 87/91 و برای مرحله ی بازشناسی ساختار %48/97 حاصل گردید. پس از اعمال روش های مقابله با خطا برای یک مجموعه ی 100 تایی از عبارات، نرخ بازشناسی مرحله ی بازشناسی نماد از %33/91 به %63/94، و نرخ بازشناسی مرحله ی بازشناسی ساختار از %63/97 به %44/98 افزایش یافت.
منابع مشابه
بازشناسی متون چاپی فارسی
برای بازشناسی کلمات سه رویکرد مبتنی بر جداسازی، مبتنی بر بازشناسی کلمه یک الگوی واحد و رویکرد ترکیبی مطرح است . در این رساله یک سیستم برای بازشناسی متون چاپی فارسی با استفاده از رویکرد ترکیبی ارائه شده است . یک الگوریتم جدید برای جداسازی حروف در کلمات چاپی بدون توجه به نوع قلم ارائه شده است . مراحل مختلف الگوریتم شامل تعیین نوار زمینه، تصحیح آن و جداسازی حروف است . در تعیین نوار زمینه روش جدیدی...
15 صفحه اولبازشناسی متون چاپی فارسی با استفاده از مدل پنهان مارکوف
این پایان نامه روشی برای بازشناسی متون چاپی فارسی و زبان های دارای الفبای مشابه آن مانند عربی ارائه می دهد. بازشناسی آخرین مرحله در فرآیند ocr است که در آن به وسیله ویژگی های به دست آمده از تصویر، متن موجود در آن تشخیص داده می شود. تصویر مورد استفاده، در مراحل قبل پیش پردازش شده، انواع نویزها و چرخش آن برطرف گشته، و در نهایت دودویی شده است. در این روش، نوع و اندازه قلم یا قلم های استفاده شده در...
بازشناسی متون فارسی با استفاده از مدل زبانی n-gram و پالایش گرامری
Abstract Text recognition has been one of the growing research topics in recent years. Many of these researches have focused on recognition of letters and sub-words as a basis for identifying larger text structures such as words, phrases and sentences. This thesis presents a new method in which the recognized sub-words are combined in order to provide meaningful words and sentences in Farsi tex...
متن کاملبازشناسی متون چاپی با بهره گیری از کدگذاری شکل و اطلاعات معنایی زمینه
بازشناسی متون چاپی، از جمله زمینه های پرکاربرد بازشناسی الگو است. تاکنون تحقیقات متعددی در زمینه ی بازشناسی متون چاپی فارسی و عربی صورت گرفته است اما این تحقیقات، غالبا با محدودیت های فراوانی به ویژه در حوزه ی عملیاتی شدن، همراه بوده اند. کلیه ی تحقیقات انجام شده در این حوزه را می توان در قالب سه رویکرد مبتنی بر جداسازی حروف، رویکرد مبتنی بر بازشناسی شکل کلی زیرکلمات و رویکرد ترکیبی، تقسیم بندی...
15 صفحه اولاستخراج ویژگیها جهت بازشناسی اشیا با الهام از بینایی انسان
در این مقاله سعی شده است تا با الگو برداری از سامانهی بینایی انسان، یک روش مقاوم و تکرارپذیر برای بازشناسی اشیا ارائه شود. یکی از معروفترین مدلهای ارائه شده مبتنی بر بینایی انسان، مدل HMAX میباشد که عملکرد مناسبی در بازشناسی اشیا از خود نشان داده است. اما تفاوتهایی نیز بین این مدل و بینایی انسان وجود دارد، به طوری که رویهی مغز به طور کامل مدل نشده است. از جمله نواقص این مدل میتوان به تک...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023